
OpenAI的强化微调:RL+Science 创造新神还是灭霸?
OpenAI的强化微调:RL+Science 创造新神还是灭霸?2024 年 12 月 6 号加州时间上午 11 点,OpenAI 发布了新的 Reinforcement Finetuning 方法,用于构造专家模型。对于特定领域的决策问题,比如医疗诊断、罕见病诊断等等,只需要上传几十到几千条训练案例,就可以通过微调来找到最有的决策。
2024 年 12 月 6 号加州时间上午 11 点,OpenAI 发布了新的 Reinforcement Finetuning 方法,用于构造专家模型。对于特定领域的决策问题,比如医疗诊断、罕见病诊断等等,只需要上传几十到几千条训练案例,就可以通过微调来找到最有的决策。
强化微调可以轻松创建具备强大推理能力的专家模型。
就在刚刚,OpenAI 年底的 AI 春晚迎来了第二弹。 如果说昨天的 ChatGPT Pro 订阅计划震撼了普通用户的钱包,那么今天推出的产品则转向了不同的目标客户群体——企业机构和开发者。
昨天,就在 OpenAI 12 天连发的第一天发布火遍全网的同时,微软也发布了一款重量级 AI 产品:Copilot Vision。这是一款集成在 Edge 浏览器中的 AI 助手,可以与你实时「协作上网」,并能随时提供帮助。
今天凌晨,云计算巨头亚马逊云科技的 re:Invent 与大号创业公司 OpenAI 的发布「撞了车」。后者公布了一系列生成式 AI 应用,价格更贵、性能更强大,而前者则致力于简化生产力矛盾,降低价格。
一天前,OpenAI 官方 X 账户的一条推文将 AI 社区的期待值拉满了。这家世界头部 AI 公司宣布将在未来的 12 天进行 12 场直播,发布一些「大大小小的新东西」。
高中就辍学的瑞典小哥,5年后竟然入职OpenAI Sora团队当研究科学家了!
几个小时前,著名 AI 研究者、OpenAI 创始成员之一 Andrej Karpathy 发布了一篇备受关注的长推文,其中分享了注意力机制背后一些或许少有人知的故事。
近日,OpenAI 的首席财务官 Sarah Friar 在接受《注册》杂志采访时表示,当前 OpenAI 并没有计划在其平台上引入广告。虽然许多用户对广告模式并不感冒,但对于一家正在努力转型为盈利公司的人工智能开发商而言,增加广告收入似乎是一个理所当然的选择。
ChatGPT已经2岁了!OpenAI下一个目标瞄准十亿用户,预计明年放出AI智能体产品。就在生日这天,马斯克还送上了大礼:阻止OpenAI全面盈利的一份诉状书。